智能论文笔记

GiDR-DUN; Gradient Dimensionality Reduction -- Differences and Unification

Andrew Draganov , Tyrus Berry , Jakob Rødsgaard Jørgensen , Katrine Scheel Nellemann , Ira Assent , Davide Mottin

分类：机器学习

2022-06-20

TSNE和UMAP是两个最流行的降低算法，因为它们的速度和可解释的低维嵌入。但是，尽管已经尝试改善TSNE的计算复杂性，但现有方法无法以UMAP的速度获得TSNE嵌入。在这项工作中，我们表明，通过将两种方法组合为单一方法，这确实是可能的。我们从理论上和实验上评估了TSNE和UMAP算法中参数的完整空间，并观察到单个参数（归一化）负责在它们之间切换。反过来，这意味着可以切换大多数算法差异而不会影响嵌入。我们讨论了这对基于UMAP框架的几种理论主张的含义，以及如何将它们与现有的TSNE解释调和。基于我们的分析，我们提出了一种新的降低性降低算法GDR，该算法结合了先前来自TSNE和UMAP的不兼容技术，并可以通过更改归一化来复制任何一种算法的结果。作为进一步的优势，GDR比可用的UMAP方法更快地执行优化，因此比可用的TSNE方法快的数量级。我们的实施是使用传统的UMAP和TSNE库的插件，可以在github.com/andrew-draganov/gidr-dun上找到。

translated by 谷歌翻译

Generalized Classification of Satellite Image Time Series with Thermal Positional Encoding

Joachim Nyborg , Charlotte Pelletier , Ira Assent

分类：计算机视觉 | 机器学习

2022-03-17

大规模的农作物类型分类是遥感工作的核心，具有经济和生态重要性的应用。当前的最新深度学习方法基于自我注意事项，并使用卫星图像时间序列（SITS）根据其独特的生长模式来区分作物类型。但是，现有方法概括地概括了训练期间未见的区域，这主要是因为由于气候变化而导致生长季节的时间变化不健全。为此，我们建议针对基于注意的农作物分类器的热位置编码（TPE）。与以前的位置编码基于日历时间（例如年度）不同，TPE是基于热时间，这是通过在整个生长季节积累每日平均温度来获得的。由于农作物的生长与热时间直接相关，但与日历时间无关，因此TPE解决了不同区域之间的时间变化以改善概括。我们提出了多种TPE策略，包括可学习的方法，以进一步改善与常见的固定位置编码相比。我们证明了我们在四个不同欧洲地区的农作物分类任务上的方法，在那里我们获得了最新的概括结果。

translated by 谷歌翻译

Weakly-Supervised Cloud Detection with Fixed-Point GANs

Joachim Nyborg , Ira Assent

分类：计算机视觉 | 机器学习

2021-11-23

卫星图像中的云的检测是遥感中的大数据的基本预处理任务。卷积神经网络（CNNS）在检测卫星图像中的云中大大提升了最先进的，但是现有的基于CNN的方法昂贵，因为它们需要大量具有昂贵的像素级云标签的训练图像。为了减轻这种成本，我们提出了针对云检测（FCD）的定点GaN，这是一种弱监督的方法。只有图像级标签训练，我们学习在清晰和阴天的图像之间的固定点转换，因此在翻译期间只影响云。这样做使我们的方法能够通过将卫星图像转换为清除并将阈值设置为两个图像之间的差异来预测像素级云标签。此外，我们提出了FCD +，在那里我们利用CNN的标签噪声稳健性来改进FCD的预测，从而进一步改进。我们展示了我们对Landsat-8生物群落云检测数据集的方法的有效性，在那里我们将性能接近与昂贵的像素级标签一起列车的现有全监督方法。通过微调我们的FCD +，只有1％的可用像素级标签，我们符合完全监督方法的性能。

translated by 谷歌翻译

TimeMatch: Unsupervised Cross-Region Adaptation by Temporal Shift Estimation

Joachim Nyborg , Charlotte Pelletier , Sébastien Lefèvre , Ira Assent

分类：计算机视觉 | 机器学习

2021-11-04

深度学习模型的最新发展，捕捉作物物候的复杂的时间模式有卫星图像时间序列（坐在），大大高级作物分类。然而，当施加到目标区域从训练区空间上不同的，这些模型差没有任何目标标签由于作物物候区域之间的时间位移进行。为了解决这个无人监督跨区域适应环境，现有方法学域不变特征没有任何目标的监督，而不是时间偏移本身。因此，这些技术提供了SITS只有有限的好处。在本文中，我们提出TimeMatch，一种新的无监督领域适应性方法SITS直接占时移。 TimeMatch由两个部分组成：1）时间位移的估计，其估计具有源极训练模型的未标记的目标区域的时间偏移，和2）TimeMatch学习，它结合了时间位移估计与半监督学习到一个分类适应未标记的目标区域。我们还引进了跨区域适应的开放式访问的数据集与来自欧洲四个不同区域的旁边。在此数据集，我们证明了TimeMatch优于所有竞争的方法，通过11％的在五个不同的适应情景F1-得分，创下了新的国家的最先进的跨区域适应性。

translated by 谷歌翻译

Active Acquisition for Multimodal Temporal Data: A Challenging Decision-Making Task

Jannik Kossen , Cătălina Cangea , Eszter Vértes , Andrew Jaegle , Viorica Patraucean , Ira Ktena , Nenad Tomasev , Danielle Belgrave

分类：机器学习 | 人工智能 | 计算机视觉 | (统计)机器学习

2022-11-09

We introduce a challenging decision-making task that we call active acquisition for multimodal temporal data (A2MT). In many real-world scenarios, input features are not readily available at test time and must instead be acquired at significant cost. With A2MT, we aim to learn agents that actively select which modalities of an input to acquire, trading off acquisition cost and predictive performance. A2MT extends a previous task called active feature acquisition to temporal decision making about high-dimensional inputs. Further, we propose a method based on the Perceiver IO architecture to address A2MT in practice. Our agents are able to solve a novel synthetic scenario requiring practically relevant cross-modal reasoning skills. On two large-scale, real-world datasets, Kinetics-700 and AudioSet, our agents successfully learn cost-reactive acquisition behavior. However, an ablation reveals they are unable to learn to learn adaptive acquisition strategies, emphasizing the difficulty of the task even for state-of-the-art models. Applications of A2MT may be impactful in domains like medicine, robotics, or finance, where modalities differ in acquisition cost and informativeness.

translated by 谷歌翻译

Multicalibrated Regression for Downstream Fairness

Ira Globus-Harris , Varun Gupta , Christopher Jung , Michael Kearns , Jamie Morgenstern , Aaron Roth

分类：机器学习

2022-09-15

我们展示了如何采用回归函数$ \ hat {f} $，该{f} $适当地``多校准''并有效地将其后处理成近似错误的分类器，使分类器满足各种公平限制。后处理不需要标记的数据，只有一定数量的未标记数据和计算。计算$ \ hat f $的计算和样本复杂性要求与解决单个公平学习任务的要求相媲美，但实际上可以用来有效地解决许多不同的下游公平约束的学习问题。我们的后处理方法可以轻松处理相交组，从而将先前的工作推广到后处理回归功能上，以满足仅应用于分离组的公平约束。我们的工作扩展了最近的工作，表明多校准的回归函数是``omnipredictors''（即可以在后处理以最佳解决无约束的ERM问题）以进行约束优化。

translated by 谷歌翻译

Affinity-Aware Graph Networks

Ameya Velingker , Ali Kemal Sinop , Ira Ktena , Petar Veličković , Sreenivas Gollapudi

分类：机器学习 | (统计)机器学习

2022-06-23

图形神经网络（GNN）已成为一种学习关系数据的强大技术。由于他们执行的消息传递步骤数量相对有限 - 因此一个较小的接收领域，人们对通过结合基础图的结构方面来提高其表现力引起了极大的兴趣。在本文中，我们探讨了亲和力措施作为图形神经网络中的特征，特别是由随机步行引起的措施，包括有效的阻力，击球和通勤时间。我们根据这些功能提出消息传递网络，并评估其在各种节点和图形属性预测任务上的性能。我们的体系结构具有较低的计算复杂性，而我们的功能对于基础图的排列不变。我们计算的措施使网络可以利用图表的连接性能，从而使我们能够超过相关的基准，用于各种任务，通常具有更少的消息传递步骤。在OGB-LSC-PCQM4MV1的最大公共图形回归数据集之一中，我们在编写时获得了最著名的单模验证MAE。

translated by 谷歌翻译

HumanNeRF: Free-viewpoint Rendering of Moving People from Monocular Video

Chung-Yi Weng , Brian Curless , Pratul P. Srinivasan , Jonathan T. Barron , Ira Kemelmacher-Shlizerman

分类：计算机视觉

2022-01-11

我们介绍了一个自由视的渲染方法 - Humannerf - 这对人类进行了复杂的身体运动的给定单曲视频工作，例如，来自YouTube的视频。我们的方法可以在任何帧中暂停视频，并从任意新相机视点呈现对象，甚至是该特定帧和身体姿势的完整360度摄像机路径。这项任务特别具有挑战性，因为它需要合成身体的光电型细节，如从输入视频中可能不存在的各种相机角度所见，以及合成布折叠和面部外观的细细节。我们的方法优化了在规范T型姿势中的人的体积表示，同时通过运动场，该运动场通过向后的警报将估计的规范表示映射到视频的每个帧。运动场分解成骨骼刚性和非刚性运动，由深网络产生。我们对现有工作显示出显着的性能改进，以及从移动人类的单眼视频的令人尖锐的观点渲染的阐释示例，以挑战不受控制的捕获场景。

translated by 谷歌翻译

StyleSDF: High-Resolution 3D-Consistent Image and Geometry Generation

Roy Or-El , Xuan Luo , Mengyi Shan , Eli Shechtman , Jeong Joon Park , Ira Kemelmacher-Shlizerman

分类：计算机视觉

2021-12-21

我们介绍了我们称呼STYLESDF的高分辨率，3D一致的图像和形状生成技术。我们的方法仅在单视图RGB数据上培训，并站在StyleGan2的肩部，用于图像生成，同时解决3D感知GANS中的两个主要挑战：1）RGB图像的高分辨率，视图 - 一致生成RGB图像，以及2）详细的3D形状。通过使用基于样式的2D发生器合并基于SDF的3D表示来实现这一目标。我们的3D隐式网络呈现出低分辨率的特征映射，其中基于样式的网络生成了View-Consive，1024x1024图像。值得注意的是，基于SDF的3D建模定义了详细的3D曲面，导致一致的卷渲染。在视觉和几何质量方面，我们的方法显示出更高的质量结果。

translated by 谷歌翻译

Flood forecasting with machine learning models in an operational framework

Sella Nevo , Efrat Morin , Adi Gerzi Rosenthal , Asher Metzger , Chen Barshai , Dana Weitzner , Dafi Voloshin , Frederik Kratzert , Gal Elidan , Gideon Dror

分类：机器学习

2021-11-04

谷歌的运营洪水预测系统是制定的，为机构和公众提供准确的实时洪水警告，重点是河流洪水在大型潮流的河流中。它在2018年开始运作，自从地理位置扩展以来。该预测系统由四个子系统组成：数据验证，阶段预测，淹没建模和警报分配。机器学习用于两个子系统。阶段预测采用长短期内存（LSTM）网络和线性模型进行建模。使用阈值和歧管模型计算洪水淹没，前者计算淹没程度，后者计算淹没程度和深度。本文首次提供的歧管模型提供了一种机器学习替代洪水淹没的液压建模。在评估历史数据时，所有型号都可以实现可操作使用的足够高的度量指标。 LSTM表现出比线性模型更高的技能，而阈值和歧管模型达到了类似的性能度量，以便在淹没程度上进行建模。在2021年的季风季节期间，洪水预警系统在印度和孟加拉国运营，覆盖河流的洪水区，总面积287,000平方公里，拥有350多万人。超过100米的洪水警报被发送给受影响的人口，相关当局以及紧急组织。系统上的当前和未来的工作包括将覆盖范围扩展到额外的洪水易发位置，以及提高建模能力和准确性。

translated by 谷歌翻译